EVILL: exploración eficaz en bandidos con perturbación lineal
Descubre EVILL, un revolucionario método de exploración para bandidos estocásticos. A diferencia de PHE, usa perturbaciones lineales en la pérdida para lograr mejores resultados. Ideal para IA.